home *** CD-ROM | disk | FTP | other *** search
/ Aminet 2 / Aminet AMIGA CDROM (1994)(Walnut Creek)[Feb 1994][W.O. 44790-1].iso / Aminet / util / gnu / emacs_src.lha / emacs-18.58 / src / syntax.c < prev    next >
C/C++ Source or Header  |  1992-04-26  |  30KB  |  1,132 lines

  1. /* GNU Emacs routines to deal with syntax tables; also word and list parsing.
  2.    Copyright (C) 1985, 1987, 1990 Free Software Foundation, Inc.
  3.  
  4. This file is part of GNU Emacs.
  5.  
  6. GNU Emacs is free software; you can redistribute it and/or modify
  7. it under the terms of the GNU General Public License as published by
  8. the Free Software Foundation; either version 1, or (at your option)
  9. any later version.
  10.  
  11. GNU Emacs is distributed in the hope that it will be useful,
  12. but WITHOUT ANY WARRANTY; without even the implied warranty of
  13. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  14. GNU General Public License for more details.
  15.  
  16. You should have received a copy of the GNU General Public License
  17. along with GNU Emacs; see the file COPYING.  If not, write to
  18. the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
  19.  
  20.  
  21. #include "config.h"
  22. #include <ctype.h>
  23. #include "lisp.h"
  24. #include "commands.h"
  25. #include "buffer.h"
  26. #include "syntax.h"
  27.  
  28. Lisp_Object Qsyntax_table_p;
  29.  
  30. DEFUN ("syntax-table-p", Fsyntax_table_p, Ssyntax_table_p, 1, 1, 0,
  31.   "Return t if ARG is a syntax table.\n\
  32. Any vector of 256 elements will do.")
  33.   (obj)
  34.      Lisp_Object obj;
  35. {
  36.   if (XTYPE (obj) == Lisp_Vector && XVECTOR (obj)->size == 0400)
  37.     return Qt;
  38.   return Qnil;
  39. }
  40.  
  41. Lisp_Object
  42. check_syntax_table (obj)
  43.      Lisp_Object obj;
  44. {
  45.   register Lisp_Object tem;
  46.   while (tem = Fsyntax_table_p (obj),
  47.      NULL (tem))
  48.     obj = wrong_type_argument (Qsyntax_table_p, obj, 0);
  49.   return obj;
  50. }   
  51.  
  52.  
  53. DEFUN ("syntax-table", Fsyntax_table, Ssyntax_table, 0, 0, 0,
  54.   "Return the current syntax table.\n\
  55. This is the one specified by the current buffer.")
  56.   ()
  57. {
  58.   return current_buffer->syntax_table;
  59. }
  60.  
  61. DEFUN ("standard-syntax-table", Fstandard_syntax_table,
  62.    Sstandard_syntax_table, 0, 0, 0,
  63.   "Return the standard syntax table.\n\
  64. This is the one used for new buffers.")
  65.   ()
  66. {
  67.   return Vstandard_syntax_table;
  68. }
  69.  
  70. DEFUN ("copy-syntax-table", Fcopy_syntax_table, Scopy_syntax_table, 0, 1, 0,
  71.   "Construct a new syntax table and return it.\n\
  72. It is a copy of the TABLE, which defaults to the standard syntax table.")
  73.   (table)
  74.      Lisp_Object table;
  75. {
  76.   Lisp_Object size, val;
  77.   XFASTINT (size) = 0400;
  78.   XFASTINT (val) = 0;
  79.   val = Fmake_vector (size, val);
  80.   if (!NULL (table))
  81.     table = check_syntax_table (table);
  82.   else if (NULL (Vstandard_syntax_table))
  83.     /* Can only be null during initialization */
  84.     return val;
  85.   else table = Vstandard_syntax_table;
  86.  
  87.   bcopy (XVECTOR (table)->contents,
  88.      XVECTOR (val)->contents, 0400 * sizeof (Lisp_Object));
  89.   return val;
  90. }
  91.  
  92. DEFUN ("set-syntax-table", Fset_syntax_table, Sset_syntax_table, 1, 1, 0,
  93.   "Select a new syntax table for the current buffer.\n\
  94. One argument, a syntax table.")
  95.   (table)
  96.      Lisp_Object table;
  97. {
  98.   table = check_syntax_table (table);
  99.   current_buffer->syntax_table = table;
  100.   /* Indicate that this buffer now has a specified syntax table.  */
  101.   current_buffer->local_var_flags |= buffer_local_flags.syntax_table;
  102.   return table;
  103. }
  104.  
  105. /* Convert a letter which signifies a syntax code
  106.  into the code it signifies.
  107.  This is used by modify-syntax-entry, and other things. */
  108.  
  109. char syntax_spec_code[0400] =
  110.   { 0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  111.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  112.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  113.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  114.     (char) Swhitespace, 0377, (char) Sstring, 0377,
  115.         (char) Smath, 0377, 0377, (char) Squote,
  116.     (char) Sopen, (char) Sclose, 0377, 0377,
  117.     0377, (char) Swhitespace, (char) Spunct, (char) Scharquote,
  118.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  119.     0377, 0377, 0377, 0377,
  120.     (char) Scomment, 0377, (char) Sendcomment, 0377,
  121.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,   /* @, A, ... */
  122.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  123.     0377, 0377, 0377, 0377, 0377, 0377, 0377, (char) Sword,
  124.     0377, 0377, 0377, 0377, (char) Sescape, 0377, 0377, (char) Ssymbol,
  125.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,   /* `, a, ... */
  126.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377,
  127.     0377, 0377, 0377, 0377, 0377, 0377, 0377, (char) Sword,
  128.     0377, 0377, 0377, 0377, 0377, 0377, 0377, 0377
  129.   };
  130.  
  131. /* Indexed by syntax code, give the letter that describes it. */
  132.  
  133. char syntax_code_spec[13] =
  134.   {
  135.     ' ', '.', 'w', '_', '(', ')', '\'', '\"', '$', '\\', '/', '<', '>'
  136.   };
  137.  
  138. DEFUN ("char-syntax", Fchar_syntax, Schar_syntax, 1, 1, 0,
  139.   "Return the syntax code of CHAR, described by a character.\n\
  140. For example, if CHAR is a word constituent, ?w is returned.\n\
  141. The characters that correspond to various syntax codes\n\
  142. are listed in the documentation of  modify-syntax-entry.")
  143.   (ch)
  144.      Lisp_Object ch;
  145. {
  146.   CHECK_NUMBER (ch, 0);
  147.   return make_number (syntax_code_spec[(int) SYNTAX (0xFF & XINT (ch))]);
  148. }
  149.  
  150. /* This comment supplies the doc string for modify-syntax-entry,
  151.    for make-docfile to see.  We cannot put this in the real DEFUN
  152.    due to limits in the Unix cpp.
  153.  
  154. DEFUN ("modify-syntax-entry", foo, bar, 0, 0, 0,
  155.   "Set syntax for character CHAR according to string S.\n\
  156. The syntax is changed only for table TABLE, which defaults to\n\
  157.  the current buffer's syntax table.\n\
  158. The first character of S should be one of the following:\n\
  159.   Space    whitespace syntax.    w   word constituent.\n\
  160.   _        symbol constituent.   .   punctuation.\n\
  161.   (        open-parenthesis.     )   close-parenthesis.\n\
  162.   \"        string quote.         \\   character-quote.\n\
  163.   $        paired delimiter.     '   expression prefix operator.\n\
  164.   <       comment starter.     >   comment ender.\n\
  165. Only single-character comment start and end sequences are represented thus.\n\
  166. Two-character sequences are represented as described below.\n\
  167. The second character of S is the matching parenthesis,\n\
  168.  used only if the first character is ( or ).\n\
  169. Any additional characters are flags.\n\
  170. Defined flags are the characters 1, 2, 3 and 4.\n\
  171.  1 means C is the start of a two-char comment start sequence.\n\
  172.  2 means C is the second character of such a sequence.\n\
  173.  3 means C is the start of a two-char comment end sequence.\n\
  174.  4 means C is the second character of such a sequence.")
  175.  
  176. */
  177.  
  178. DEFUN ("modify-syntax-entry", Fmodify_syntax_entry, Smodify_syntax_entry, 2, 3, 
  179.   /* I really don't know why this is interactive
  180.      help-form should at least be made useful whilst reading the second arg
  181.    */
  182.   "cSet syntax for character: \nsSet syntax for %s to: ",
  183.   0 /* See immediately above */)
  184.   (c, newentry, syntax_table)
  185.      Lisp_Object c, newentry, syntax_table;
  186. {
  187.   register unsigned char *p, match;
  188.   register enum syntaxcode code;
  189.   Lisp_Object val;
  190.  
  191.   CHECK_NUMBER (c, 0);
  192.   CHECK_STRING (newentry, 1);
  193.   if (NULL (syntax_table))
  194.     syntax_table = current_buffer->syntax_table;
  195.   else
  196.     syntax_table = check_syntax_table (syntax_table);
  197.  
  198.   p = XSTRING (newentry)->data;
  199.   code = (enum syntaxcode) syntax_spec_code[*p++];
  200.   if (((int) code & 0377) == 0377)
  201.     error ("invalid syntax description letter: %c", c);
  202.  
  203.   match = *p;
  204.   if (match) p++;
  205.   if (match == ' ') match = 0;
  206.  
  207.   XFASTINT (val) = (match << 8) + (int) code;
  208.   while (*p)
  209.     switch (*p++)
  210.       {
  211.       case '1':
  212.     XFASTINT (val) |= 1 << 16;
  213.     break;
  214.  
  215.       case '2':
  216.     XFASTINT (val) |= 1 << 17;
  217.     break;
  218.  
  219.       case '3':
  220.     XFASTINT (val) |= 1 << 18;
  221.     break;
  222.  
  223.       case '4':
  224.     XFASTINT (val) |= 1 << 19;
  225.     break;
  226.       }
  227.     
  228.   XVECTOR (syntax_table)->contents[0xFF & XINT (c)] = val;
  229.  
  230.   return Qnil;
  231. }
  232.  
  233. /* Dump syntax table to buffer in human-readable format */
  234.  
  235. describe_syntax (value)
  236.     Lisp_Object value;
  237. {
  238.   register enum syntaxcode code;
  239.   char desc, match, start1, start2, end1, end2;
  240.   char str[2];
  241.  
  242.   Findent_to (make_number (16), make_number (1));
  243.  
  244.   if (XTYPE (value) != Lisp_Int)
  245.     {
  246.       InsStr ("invalid");
  247.       return;
  248.     }
  249.  
  250.   code = (enum syntaxcode) (XINT (value) & 0377);
  251.   match = (XINT (value) >> 8) & 0377;
  252.   start1 = (XINT (value) >> 16) & 1;
  253.   start2 = (XINT (value) >> 17) & 1;
  254.   end1 = (XINT (value) >> 18) & 1;
  255.   end2 = (XINT (value) >> 19) & 1;
  256.  
  257.   if ((int) code < 0 || (int) code >= (int) Smax)
  258.     {
  259.       InsStr ("invalid");
  260.       return;
  261.     }
  262.   desc = syntax_code_spec[(int) code];
  263.  
  264.   str[0] = desc, str[1] = 0;
  265.   insert (str, 1);
  266.  
  267.   str[0] = match ? match : ' ';
  268.   insert (str, 1);
  269.  
  270.  
  271.   if (start1)
  272.     insert ("1", 1);
  273.   if (start2)
  274.     insert ("2", 1);
  275.  
  276.   if (end1)
  277.     insert ("3", 1);
  278.   if (end2)
  279.     insert ("4", 1);
  280.  
  281.   InsStr ("\twhich means: ");
  282.  
  283. #ifdef SWITCH_ENUM_BUG
  284.   switch ((int) code)
  285. #else
  286.   switch (code)
  287. #endif
  288.     {
  289.     case Swhitespace:
  290.       InsStr ("whitespace"); break;
  291.     case Spunct:
  292.       InsStr ("punctuation"); break;
  293.     case Sword:
  294.       InsStr ("word"); break;
  295.     case Ssymbol:
  296.       InsStr ("symbol"); break;
  297.     case Sopen:
  298.       InsStr ("open"); break;
  299.     case Sclose:
  300.       InsStr ("close"); break;
  301.     case Squote:
  302.       InsStr ("quote"); break;
  303.     case Sstring:
  304.       InsStr ("string"); break;
  305.     case Smath:
  306.       InsStr ("math"); break;
  307.     case Sescape:
  308.       InsStr ("escape"); break;
  309.     case Scharquote:
  310.       InsStr ("charquote"); break;
  311.     case Scomment:
  312.       InsStr ("comment"); break;
  313.     case Sendcomment:
  314.       InsStr ("endcomment"); break;
  315.     default:
  316.       InsStr ("invalid");
  317.       return;
  318.     }
  319.  
  320.   if (match)
  321.     {
  322.       InsStr (", matches ");
  323.       
  324.       str[0] = match, str[1] = 0;
  325.       insert (str, 1);
  326.     }
  327.  
  328.   if (start1)
  329.     InsStr (",\n\t  is the first character of a comment-start sequence");
  330.   if (start2)
  331.     InsStr (",\n\t  is the second character of a comment-start sequence");
  332.  
  333.   if (end1)
  334.     InsStr (",\n\t  is the first character of a comment-end sequence");
  335.   if (end2)
  336.     InsStr (",\n\t  is the second character of a comment-end sequence");
  337.  
  338.   InsStr ("\n");
  339. }
  340.  
  341. Lisp_Object
  342. describe_syntax_1 (vector)
  343.      Lisp_Object vector;
  344. {
  345.   struct buffer *old = current_buffer;
  346.   set_buffer_internal (XBUFFER (Vstandard_output));
  347.   describe_vector (vector, Qnil, describe_syntax, 0, Qnil);
  348.   set_buffer_internal (old);
  349.   return Qnil;
  350. }
  351.  
  352. DEFUN ("describe-syntax", Fdescribe_syntax, Sdescribe_syntax, 0, 0, "",
  353.   "Describe the syntax specifications in the syntax table.\n\
  354. The descriptions are inserted in a buffer, which is selected so you can see it.")
  355.   ()
  356. {
  357.   internal_with_output_to_temp_buffer
  358.      ("*Help*", describe_syntax_1, current_buffer->syntax_table);
  359.  
  360.   return Qnil;
  361. }
  362.  
  363. /* Return the position across `count' words from `from'.
  364.    If that many words cannot be found before the end of the buffer, return 0.
  365.    `count' negative means scan backward and stop at word beginning.  */
  366.  
  367. scan_words (from, count)
  368.      register int from, count;
  369. {
  370.   register int beg = BEGV;
  371.   register int end = ZV;
  372.  
  373.   immediate_quit = 1;
  374.   QUIT;
  375.  
  376.   while (count > 0)
  377.     {
  378.       while (1)
  379.     {
  380.       if (from == end)
  381.         {
  382.           immediate_quit = 0;
  383.           return 0;
  384.         }
  385.       if (SYNTAX(FETCH_CHAR (from)) == Sword)
  386.         break;
  387.       from++;
  388.     }
  389.       while (1)
  390.     {
  391.       if (from == end) break;
  392.       if (SYNTAX(FETCH_CHAR (from)) != Sword)
  393.         break;
  394.       from++;
  395.     }
  396.       count--;
  397.     }
  398.   while (count < 0)
  399.     {
  400.       while (1)
  401.     {
  402.       if (from == beg)
  403.         {
  404.           immediate_quit = 0;
  405.           return 0;
  406.         }
  407.       if (SYNTAX(FETCH_CHAR (from - 1)) == Sword)
  408.         break;
  409.       from--;
  410.     }
  411.       while (1)
  412.     {
  413.       if (from == beg) break;
  414.       if (SYNTAX(FETCH_CHAR (from - 1)) != Sword)
  415.         break;
  416.       from--;
  417.     }
  418.       count++;
  419.     }
  420.  
  421.   immediate_quit = 0;
  422.  
  423.   return from;
  424. }
  425.  
  426. DEFUN ("forward-word", Fforward_word, Sforward_word, 1, 1, "p",
  427.   "Move point forward ARG words (backward if ARG is negative).\n\
  428. Normally returns t.\n\
  429. If an edge of the buffer is reached, point is left there\n\
  430. and nil is returned.")
  431.   (count)
  432.      Lisp_Object count;
  433. {
  434.   int val;
  435.   CHECK_NUMBER (count, 0);
  436.  
  437.   if (!(val = scan_words (point, XINT (count))))
  438.     {
  439.       SET_PT (XINT (count) > 0 ? ZV : BEGV);
  440.       return Qnil;
  441.     }
  442.   SET_PT (val);
  443.   return Qt;
  444. }
  445.  
  446. int parse_sexp_ignore_comments;
  447.  
  448. Lisp_Object
  449. scan_lists (from, count, depth, sexpflag)
  450.      register int from;
  451.      int count, depth, sexpflag;
  452. {
  453.   Lisp_Object val;
  454.   register int stop;
  455.   register int c;
  456.   char stringterm;
  457.   int quoted;
  458.   int mathexit = 0;
  459.   register enum syntaxcode code;
  460.   int min_depth = depth;    /* Err out if depth gets less than this. */
  461.  
  462.   if (depth > 0) min_depth = 0;
  463.  
  464.   immediate_quit = 1;
  465.   QUIT;
  466.  
  467.   while (count > 0)
  468.     {
  469.       stop = ZV;
  470.       while (from < stop)
  471.     {
  472.       c = FETCH_CHAR (from);
  473.       code = SYNTAX(c);
  474.       from++;
  475.       if (from < stop && SYNTAX_COMSTART_FIRST (c)
  476.           && SYNTAX_COMSTART_SECOND (FETCH_CHAR (from))
  477.           && parse_sexp_ignore_comments)
  478.         code = Scomment, from++;
  479.  
  480. #ifdef SWITCH_ENUM_BUG
  481.       switch ((int) code)
  482. #else
  483.       switch (code)
  484. #endif
  485.         {
  486.         case Sescape:
  487.         case Scharquote:
  488.           if (from == stop) goto lose;
  489.           from++;
  490.           /* treat following character as a word constituent */
  491.         case Sword:
  492.         case Ssymbol:
  493.           if (depth || !sexpflag) break;
  494.           /* This word counts as a sexp; return at end of it. */
  495.           while (from < stop)
  496.         {
  497. #ifdef SWITCH_ENUM_BUG
  498.           switch ((int) SYNTAX(FETCH_CHAR (from)))
  499. #else
  500.           switch (SYNTAX(FETCH_CHAR (from)))
  501. #endif
  502.             {
  503.             case Scharquote:
  504.             case Sescape:
  505.               from++;
  506.               if (from == stop) goto lose;
  507.               break;
  508.             case Sword:
  509.             case Ssymbol:
  510.             case Squote:
  511.               break;
  512.             default:
  513.               goto done;
  514.             }
  515.           from++;
  516.         }
  517.           goto done;
  518.  
  519.         case Scomment:
  520.           if (!parse_sexp_ignore_comments) break;
  521.           while (1)
  522.         {
  523.           if (from == stop) goto done;
  524.           if (SYNTAX (c = FETCH_CHAR (from)) == Sendcomment)
  525.             break;
  526.           from++;
  527.           if (from < stop && SYNTAX_COMEND_FIRST (c)
  528.                && SYNTAX_COMEND_SECOND (FETCH_CHAR (from)))
  529.             { from++; break; }
  530.         }
  531.           break;
  532.  
  533.         case Smath:
  534.           if (!sexpflag)
  535.         break;
  536.           if (from != stop && c == FETCH_CHAR (from))
  537.         from++;
  538.           if (mathexit)
  539.         {
  540.           mathexit = 0;
  541.           goto close1;
  542.         }
  543.           mathexit = 1;
  544.  
  545.         case Sopen:
  546.           if (!++depth) goto done;
  547.           break;
  548.  
  549.         case Sclose:
  550.         close1:
  551.           if (!--depth) goto done;
  552.           if (depth < min_depth)
  553.         error ("Containing expression ends prematurely");
  554.           break;
  555.  
  556.         case Sstring:
  557.           stringterm = FETCH_CHAR (from - 1);
  558.           while (1)
  559.         {
  560.           if (from >= stop) goto lose;
  561.           if (FETCH_CHAR (from) == stringterm) break;
  562. #ifdef SWITCH_ENUM_BUG
  563.           switch ((int) SYNTAX(FETCH_CHAR (from)))
  564. #else
  565.           switch (SYNTAX(FETCH_CHAR (from)))
  566. #endif
  567.             {
  568.             case Scharquote:
  569.             case Sescape:
  570.               from++;
  571.             }
  572.           from++;
  573.         }
  574.           from++;
  575.           if (!depth && sexpflag) goto done;
  576.           break;
  577.         }
  578.     }
  579.  
  580.       /* Reached end of buffer.  Error if within object, return nil if between */
  581.       if (depth) goto lose;
  582.  
  583.       immediate_quit = 0;
  584.       return Qnil;
  585.  
  586.       /* End of object reached */
  587.     done:
  588.       count--;
  589.     }
  590.  
  591.   while (count < 0)
  592.     {
  593.       stop = BEGV;
  594.       while (from > stop)
  595.     {
  596.       from--;
  597.       if (quoted = char_quoted (from))
  598.         from--;
  599.       c = FETCH_CHAR (from);
  600.       code = SYNTAX (c);
  601.       if (from > stop && SYNTAX_COMEND_SECOND (c)
  602.           && SYNTAX_COMEND_FIRST (FETCH_CHAR (from - 1))
  603.           && !char_quoted (from - 1)
  604.           && parse_sexp_ignore_comments)
  605.         code = Sendcomment, from--;
  606.  
  607. #ifdef SWITCH_ENUM_BUG
  608.       switch ((int) (quoted ? Sword : code))
  609. #else
  610.       switch (quoted ? Sword : code)
  611. #endif
  612.         {
  613.         case Sword:
  614.         case Ssymbol:
  615.           if (depth || !sexpflag) break;
  616.           /* This word counts as a sexp; count object finished after passing it. */
  617.           while (from > stop)
  618.         {
  619.           if (quoted = char_quoted (from - 1))
  620.             from--;
  621.           if (! (quoted || SYNTAX(FETCH_CHAR (from - 1)) == Sword ||
  622.              SYNTAX(FETCH_CHAR (from - 1)) == Ssymbol ||
  623.              SYNTAX(FETCH_CHAR (from - 1)) == Squote))
  624.                     goto done2;
  625.           from--;
  626.         }
  627.           goto done2;
  628.  
  629.         case Smath:
  630.           if (!sexpflag)
  631.         break;
  632.           if (from != stop && c == FETCH_CHAR (from - 1))
  633.         from--;
  634.           if (mathexit)
  635.         {
  636.           mathexit = 0;
  637.           goto open2;
  638.         }
  639.           mathexit = 1;
  640.  
  641.         case Sclose:
  642.           if (!++depth) goto done2;
  643.           break;
  644.  
  645.         case Sopen:
  646.         open2:
  647.           if (!--depth) goto done2;
  648.           if (depth < min_depth)
  649.         error ("Containing expression ends prematurely");
  650.           break;
  651.  
  652.         case Sendcomment:
  653.           if (!parse_sexp_ignore_comments) break;
  654.           if (from != stop) from--;
  655.           while (1)
  656.         {
  657.           if (SYNTAX (c = FETCH_CHAR (from)) == Scomment)
  658.             break;
  659.           if (from == stop) goto done;
  660.           from--;
  661.           if (SYNTAX_COMSTART_SECOND (c)
  662.               && SYNTAX_COMSTART_FIRST (FETCH_CHAR (from))
  663.               && !char_quoted (from))
  664.             break;
  665.         }
  666.           break;
  667.  
  668.         case Sstring:
  669.           stringterm = FETCH_CHAR (from);
  670.           while (1)
  671.         {
  672.           if (from == stop) goto lose;
  673.           if (!char_quoted (from - 1)
  674.               && stringterm == FETCH_CHAR (from - 1))
  675.             break;
  676.           from--;
  677.         }
  678.           from--;
  679.           if (!depth && sexpflag) goto done2;
  680.           break;
  681.         }
  682.     }
  683.  
  684.       /* Reached start of buffer.  Error if within object, return nil if between */
  685.       if (depth) goto lose;
  686.  
  687.       immediate_quit = 0;
  688.       return Qnil;
  689.  
  690.     done2:
  691.       count++;
  692.     }
  693.  
  694.  
  695.   immediate_quit = 0;
  696.   XFASTINT (val) = from;
  697.   return val;
  698.  
  699.  lose:
  700.   error ("Unbalanced parentheses");
  701.   /* NOTREACHED */
  702. }
  703.  
  704. char_quoted (pos)
  705.      register int pos;
  706. {
  707.   register enum syntaxcode code;
  708.   register int beg = BEGV;
  709.   register int quoted = 0;
  710.  
  711.   while (pos > beg &&
  712.      ((code = SYNTAX (FETCH_CHAR (pos - 1))) == Scharquote
  713.       || code == Sescape))
  714.     pos--, quoted = !quoted;
  715.   return quoted;
  716. }
  717.  
  718. DEFUN ("scan-lists", Fscan_lists, Sscan_lists, 3, 3, 0,
  719.   "Scan from character number FROM by COUNT lists.\n\
  720. Returns the character number of the position thus found.\n\
  721. \n\
  722. If DEPTH is nonzero, paren depth begins counting from that value,\n\
  723. only places where the depth in parentheses becomes zero\n\
  724. are candidates for stopping; COUNT such places are counted.\n\
  725. Thus, a positive value for DEPTH means go out levels.\n\
  726. \n\
  727. Comments are ignored if parse-sexp-ignore-comments is non-nil.\n\
  728. \n\
  729. If the beginning or end of (the visible part of) the buffer is reached\n\
  730. and the depth is wrong, an error is signaled.\n\
  731. If the depth is right but the count is not used up, nil is returned.")
  732.   (from, count, depth)
  733.      Lisp_Object from, count, depth;
  734. {
  735.   CHECK_NUMBER (from, 0);
  736.   CHECK_NUMBER (count, 1);
  737.   CHECK_NUMBER (depth, 2);
  738.  
  739.   return scan_lists (XINT (from), XINT (count), XINT (depth), 0);
  740. }
  741.  
  742. DEFUN ("scan-sexps", Fscan_sexps, Sscan_sexps, 2, 2, 0,
  743.   "Scan from character number FROM by COUNT balanced expressions.\n\
  744. Returns the character number of the position thus found.\n\
  745. \n\
  746. Comments are ignored if parse-sexp-ignore-comments is non-nil.\n\
  747. \n\
  748. If the beginning or end of (the visible part of) the buffer is reached\n\
  749. in the middle of a parenthetical grouping, an error is signaled.\n\
  750. If the beginning or end is reached between groupings but before count is used up,\n\
  751. nil is returned.")
  752.   (from, count)
  753.      Lisp_Object from, count;
  754. {
  755.   CHECK_NUMBER (from, 0);
  756.   CHECK_NUMBER (count, 1);
  757.  
  758.   return scan_lists (XINT (from), XINT (count), 0, 1);
  759. }
  760.  
  761. DEFUN ("backward-prefix-chars", Fbackward_prefix_chars, Sbackward_prefix_chars,
  762.   0, 0, 0,
  763.   "Move point backward over any number of chars with syntax \"prefix\".")
  764.   ()
  765. {
  766.   int beg = BEGV;
  767.   int pos = point;
  768.  
  769.   while (pos > beg && !char_quoted (pos - 1) && SYNTAX (FETCH_CHAR (pos - 1)) == Squote)
  770.     pos--;
  771.  
  772.   SET_PT (pos);
  773.  
  774.   return Qnil;
  775. }
  776.  
  777. struct lisp_parse_state
  778.   {
  779.     int depth;        /* Depth at end of parsing */
  780.     int instring;    /* -1 if not within string, else desired terminator. */
  781.     int incomment;    /* Nonzero if within a comment at end of parsing */
  782.     int quoted;        /* Nonzero if just after an escape char at end of parsing */
  783.     int thislevelstart;    /* Char number of most recent start-of-expression at current level */
  784.     int prevlevelstart; /* Char number of start of containing expression */
  785.     int location;    /* Char number at which parsing stopped. */
  786.     int mindepth;    /* Minimum depth seen while scanning.  */
  787.   };
  788.  
  789. /* Parse forward from FROM to END,
  790.    assuming that FROM is the start of a function, 
  791.    and return a description of the state of the parse at END. */
  792.  
  793. struct lisp_parse_state val_scan_sexps_forward;
  794.  
  795. struct lisp_parse_state *
  796. scan_sexps_forward (from, end, targetdepth, stopbefore, oldstate)
  797.      register int from;
  798.      int end, targetdepth, stopbefore;
  799.      Lisp_Object oldstate;
  800. {
  801.   struct lisp_parse_state state;
  802.  
  803.   register enum syntaxcode code;
  804.   struct level { int last, prev; };
  805.   struct level levelstart[100];
  806.   register struct level *curlevel = levelstart;
  807.   struct level *endlevel = levelstart + 100;
  808.   char prev;
  809.   register int depth;    /* Paren depth of current scanning location.
  810.                level - levelstart equals this except
  811.                when the depth becomes negative.  */
  812.   int mindepth;        /* Lowest DEPTH value seen.  */
  813.   int start_quoted = 0;        /* Nonzero means starting after a char quote */
  814.   Lisp_Object tem;
  815.  
  816.   immediate_quit = 1;
  817.   QUIT;
  818.  
  819.   if (NULL (oldstate))
  820.     {
  821.       depth = 0;
  822.       state.instring = -1;
  823.       state.incomment = 0;
  824.     }
  825.   else
  826.     {
  827.       tem = Fcar (oldstate);
  828.       if (!NULL (tem))
  829.     depth = XINT (tem);
  830.       else
  831.     depth = 0;
  832.  
  833.       oldstate = Fcdr (oldstate);
  834.       oldstate = Fcdr (oldstate);
  835.       oldstate = Fcdr (oldstate);
  836.       tem = Fcar (oldstate);
  837.       state.instring = !NULL (tem) ? XINT (tem) : -1;
  838.  
  839.       oldstate = Fcdr (oldstate);
  840.       tem = Fcar (oldstate);
  841.       state.incomment = !NULL (tem);
  842.  
  843.       oldstate = Fcdr (oldstate);
  844.       tem = Fcar (oldstate);
  845.       start_quoted = !NULL (tem);
  846.     }
  847.   state.quoted = 0;
  848.   mindepth = depth;
  849.  
  850.   curlevel->prev = -1;
  851.   curlevel->last = -1;
  852.  
  853.   /* Enter the loop at a place appropriate for initial state. */
  854.  
  855.   if (state.incomment) goto startincomment;
  856.   if (state.instring >= 0)
  857.     {
  858.       if (start_quoted) goto startquotedinstring;
  859.       goto startinstring;
  860.     }
  861.   if (start_quoted) goto startquoted;
  862.  
  863.   while (from < end)
  864.     {
  865.       code = SYNTAX(FETCH_CHAR (from));
  866.       from++;
  867.       if (from < end && SYNTAX_COMSTART_FIRST (FETCH_CHAR (from - 1))
  868.        && SYNTAX_COMSTART_SECOND (FETCH_CHAR (from)))
  869.     code = Scomment, from++;
  870. #ifdef SWITCH_ENUM_BUG
  871.       switch ((int) code)
  872. #else
  873.       switch (code)
  874. #endif
  875.     {
  876.     case Sescape:
  877.     case Scharquote:
  878.       if (stopbefore) goto stop;  /* this arg means stop at sexp start */
  879.       curlevel->last = from - 1;
  880.     startquoted:
  881.       if (from == end) goto endquoted;
  882.       from++;
  883.       goto symstarted;
  884.       /* treat following character as a word constituent */
  885.     case Sword:
  886.     case Ssymbol:
  887.       if (stopbefore) goto stop;  /* this arg means stop at sexp start */
  888.       curlevel->last = from - 1;
  889.     symstarted:
  890.       while (from < end)
  891.         {
  892. #ifdef SWITCH_ENUM_BUG
  893.           switch ((int) SYNTAX(FETCH_CHAR (from)))
  894. #else
  895.           switch (SYNTAX(FETCH_CHAR (from)))
  896. #endif
  897.         {
  898.         case Scharquote:
  899.         case Sescape:
  900.           from++;
  901.           if (from == end) goto endquoted;
  902.           break;
  903.         case Sword:
  904.         case Ssymbol:
  905.         case Squote:
  906.           break;
  907.         default:
  908.           goto symdone;
  909.         }
  910.           from++;
  911.         }
  912.     symdone:
  913.       curlevel->prev = curlevel->last;
  914.       break;
  915.  
  916.     case Scomment:
  917.       state.incomment = 1;
  918.     startincomment:
  919.       while (1)
  920.         {
  921.           if (from == end) goto done;
  922.           if (SYNTAX (prev = FETCH_CHAR (from)) == Sendcomment)
  923.         break;
  924.           from++;
  925.           if (from < end && SYNTAX_COMEND_FIRST (prev)
  926.            && SYNTAX_COMEND_SECOND (FETCH_CHAR (from)))
  927.         { from++; break; }
  928.         }
  929.       state.incomment = 0;
  930.       break;
  931.  
  932.     case Sopen:
  933.       if (stopbefore) goto stop;  /* this arg means stop at sexp start */
  934.       depth++;
  935.       /* curlevel++->last ran into compiler bug on Apollo */
  936.       curlevel->last = from - 1;
  937.       if (++curlevel == endlevel)
  938.         error ("Nesting too deep for parser");
  939.       curlevel->prev = -1;
  940.       curlevel->last = -1;
  941.       if (!--targetdepth) goto done;
  942.       break;
  943.  
  944.     case Sclose:
  945.       depth--;
  946.       if (depth < mindepth)
  947.         mindepth = depth;
  948.       if (curlevel != levelstart)
  949.         curlevel--;
  950.       curlevel->prev = curlevel->last;
  951.       if (!++targetdepth) goto done;
  952.       break;
  953.  
  954.     case Sstring:
  955.       if (stopbefore) goto stop;  /* this arg means stop at sexp start */
  956.       curlevel->last = from - 1;
  957.       state.instring = FETCH_CHAR (from - 1);
  958.     startinstring:
  959.       while (1)
  960.         {
  961.           if (from >= end) goto done;
  962.           if (FETCH_CHAR (from) == state.instring) break;
  963. #ifdef SWITCH_ENUM_BUG
  964.           switch ((int) SYNTAX(FETCH_CHAR (from)))
  965. #else
  966.           switch (SYNTAX(FETCH_CHAR (from)))
  967. #endif
  968.         {
  969.         case Scharquote:
  970.         case Sescape:
  971.           from++;
  972.         startquotedinstring:
  973.           if (from >= end) goto endquoted;
  974.         }
  975.           from++;
  976.         }
  977.       state.instring = -1;
  978.       curlevel->prev = curlevel->last;
  979.       from++;
  980.       break;
  981.  
  982.     case Smath:
  983.       break;
  984.     }
  985.     }
  986.   goto done;
  987.  
  988.  stop:   /* Here if stopping before start of sexp. */
  989.   from--;    /* We have just fetched the char that starts it; */
  990.   goto done; /* but return the position before it. */
  991.  
  992.  endquoted:
  993.   state.quoted = 1;
  994.  done:
  995.   state.depth = depth;
  996.   state.mindepth = mindepth;
  997.   state.thislevelstart = curlevel->prev;
  998.   state.prevlevelstart
  999.     = (curlevel == levelstart) ? -1 : (curlevel - 1)->last;
  1000.   state.location = from;
  1001.   immediate_quit = 0;
  1002.  
  1003.   val_scan_sexps_forward = state;
  1004.   return &val_scan_sexps_forward;
  1005. }
  1006.  
  1007. /* This comment supplies the doc string for parse-partial-sexp,
  1008.    for make-docfile to see.  We cannot put this in the real DEFUN
  1009.    due to limits in the Unix cpp.
  1010.  
  1011. DEFUN ("parse-partial-sexp", Ffoo, Sfoo, 0, 0, 0,
  1012.   "Parse Lisp syntax starting at FROM until TO; return status of parse at TO.\n\
  1013. Parsing stops at TO or when certain criteria are met;\n\
  1014.  point is set to where parsing stops.\n\
  1015. If fifth arg STATE is omitted or nil,\n\
  1016.  parsing assumes that FROM is the beginning of a function.\n\
  1017. Value is a list of seven elements describing final state of parsing:\n\
  1018.  1. depth in parens.\n\
  1019.  2. character address of start of innermost containing list; nil if none.\n\
  1020.  3. character address of start of last complete sexp terminated.\n\
  1021.  4. non-nil if inside a string.\n\
  1022.     (it is the character that will terminate the string.)\n\
  1023.  5. t if inside a comment.\n\
  1024.  6. t if following a quote character.\n\
  1025.  7. the minimum paren-depth encountered during this scan.\n\
  1026. If third arg TARGETDEPTH is non-nil, parsing stops if the depth\n\
  1027. in parentheses becomes equal to TARGETDEPTH.\n\
  1028. Fourth arg STOPBEFORE non-nil means stop when come to\n\
  1029.  any character that starts a sexp.\n\
  1030. Fifth arg STATE is a seven-list like what this function returns.\n\
  1031. It is used to initialize the state of the parse.")
  1032.  
  1033. */
  1034.  
  1035. DEFUN ("parse-partial-sexp", Fparse_partial_sexp, Sparse_partial_sexp, 2, 5, 0,
  1036.   0 /* See immediately above */)
  1037.   (from, to, targetdepth, stopbefore, oldstate)
  1038.      Lisp_Object from, to, targetdepth, stopbefore, oldstate;
  1039. {
  1040.   struct lisp_parse_state state;
  1041.   int target;
  1042.  
  1043.   if (!NULL (targetdepth))
  1044.     {
  1045.       CHECK_NUMBER (targetdepth, 3);
  1046.       target = XINT (targetdepth);
  1047.     }
  1048.   else
  1049.     target = -100000;        /* We won't reach this depth */
  1050.  
  1051.   validate_region (&from, &to);
  1052.   state = *scan_sexps_forward (XINT (from), XINT (to),
  1053.                    target, !NULL (stopbefore), oldstate);
  1054.  
  1055.   SET_PT (state.location);
  1056.   
  1057.   return Fcons (make_number (state.depth),
  1058.        Fcons (state.prevlevelstart < 0 ? Qnil : make_number (state.prevlevelstart),
  1059.          Fcons (state.thislevelstart < 0 ? Qnil : make_number (state.thislevelstart),
  1060.            Fcons (state.instring >= 0 ? make_number (state.instring) : Qnil,
  1061.          Fcons (state.incomment ? Qt : Qnil,
  1062.            Fcons (state.quoted ? Qt : Qnil,
  1063.               Fcons (make_number (state.mindepth), Qnil)))))));
  1064. }
  1065.  
  1066. init_syntax_once ()
  1067. {
  1068.   register int i;
  1069.   register struct Lisp_Vector *v;
  1070.  
  1071.   /* Set this now, so first buffer creation can refer to it. */
  1072.   /* Make it nil before calling copy-syntax-table
  1073.     so that copy-syntax-table will know not to try to copy from garbage */
  1074.   Vstandard_syntax_table = Qnil;
  1075.   Vstandard_syntax_table = Fcopy_syntax_table (Qnil);
  1076.  
  1077.   v = XVECTOR (Vstandard_syntax_table);
  1078.  
  1079.   for (i = 'a'; i <= 'z'; i++)
  1080.     XFASTINT (v->contents[i]) = (int) Sword;
  1081.   for (i = 'A'; i <= 'Z'; i++)
  1082.     XFASTINT (v->contents[i]) = (int) Sword;
  1083.   for (i = '0'; i <= '9'; i++)
  1084.     XFASTINT (v->contents[i]) = (int) Sword;
  1085.   XFASTINT (v->contents['$']) = (int) Sword;
  1086.   XFASTINT (v->contents['%']) = (int) Sword;
  1087.  
  1088.   XFASTINT (v->contents['(']) = (int) Sopen + (')' << 8);
  1089.   XFASTINT (v->contents[')']) = (int) Sclose + ('(' << 8);
  1090.   XFASTINT (v->contents['[']) = (int) Sopen + (']' << 8);
  1091.   XFASTINT (v->contents[']']) = (int) Sclose + ('[' << 8);
  1092.   XFASTINT (v->contents['{']) = (int) Sopen + ('}' << 8);
  1093.   XFASTINT (v->contents['}']) = (int) Sclose + ('{' << 8);
  1094.   XFASTINT (v->contents['"']) = (int) Sstring;
  1095.   XFASTINT (v->contents['\\']) = (int) Sescape;
  1096.  
  1097.   for (i = 0; i < 10; i++)
  1098.     XFASTINT (v->contents["_-+*/&|<>="[i]]) = (int) Ssymbol;
  1099.  
  1100.   for (i = 0; i < 12; i++)
  1101.     XFASTINT (v->contents[".,;:?!#@~^'`"[i]]) = (int) Spunct;
  1102. }
  1103.  
  1104. syms_of_syntax ()
  1105. {
  1106.   Qsyntax_table_p = intern ("syntax-table-p");
  1107.   staticpro (&Qsyntax_table_p);
  1108.  
  1109.   DEFVAR_BOOL ("parse-sexp-ignore-comments", &parse_sexp_ignore_comments,
  1110.     "Non-nil means forward-sexp, etc., should treat comments as whitespace.\n\
  1111. Non-nil works only when the comment terminator is something like *\/,\n\
  1112. and appears only when it ends a comment.\n\
  1113. If comments are terminated by newlines,\n\
  1114. you must make this variable nil.");
  1115.  
  1116.   defsubr (&Ssyntax_table_p);
  1117.   defsubr (&Ssyntax_table);
  1118.   defsubr (&Sstandard_syntax_table);
  1119.   defsubr (&Scopy_syntax_table);
  1120.   defsubr (&Sset_syntax_table);
  1121.   defsubr (&Schar_syntax);
  1122.   defsubr (&Smodify_syntax_entry);
  1123.   defsubr (&Sdescribe_syntax);
  1124.  
  1125.   defsubr (&Sforward_word);
  1126.  
  1127.   defsubr (&Sscan_lists);
  1128.   defsubr (&Sscan_sexps);
  1129.   defsubr (&Sbackward_prefix_chars);
  1130.   defsubr (&Sparse_partial_sexp);
  1131. }
  1132.